在WWDC 2017,蘋果(Apple)宣布將於年底推出搭載Siri的智慧喇叭HomePod,正式加入家用智慧語音助理戰場。三大平台業者各有優勢,蘋果的HomePod主打與音樂服務的結合與音響等級的品質;Google Assistant則掌握了Google日曆、地圖、E-mail等周邊功能的廣大用戶;而亞馬遜(Amazon)的Alexa則是積極敞開大門,與其他廠商開發的應用結合,並允許各廠商可讓自行開發硬體。對終端產品製造商而言,目前Alexa是發揮空間最大的平台,因此,對應Alexa的晶片平台必須具備一定的客製化開發空間,才能協助客戶實現與眾不同的產品設計。
美高森美(Microsemi)語音事業部總監Shahin Sadeghi表示,家用智慧語音助理是一個非常火熱的應用市場,據ABI Research預估,僅採用亞馬遜Alexa語音助理的智慧聯網裝置,到2022年時,年出貨量就可望高達7,500萬台,其中三分之二將是智慧喇叭或數位助理型態的產品。若加上採用蘋果、Google、微軟等平台的其他同類型硬體產品,整個家用智慧語音助理硬體的市場前景,想像空間將更加龐大。
不過,每當市場出現爆發式成長,往往也是紅海競爭的開端。為了協助客戶實現差異化的產品設計,美高森美於2017台北國際電腦展(COMPUTEX Taipei 2017)期間了展示為Amazon AVS(Alexa Voice Service)所採用的ZLK38AVS AcuEdge套件。該產品不僅能協助廠商開發的產品順利過濾雜音,並且準確接收到使用者的語音指令,也能夠隨著廠商需求客製其他功能,例如將玻璃破碎聲、嬰兒哭泣聲建檔,一旦設備接收到類似的聲音訊號,便可立即透過手機App向消費者發出警示。這將使語音助理這類產品具備新的定位–成為家庭保全監控的一環。
AcuEdge平台是以美高森美的Timberwolf音訊處理器為核心。該處理器是一顆內建語音處理硬體加速器的數位訊號處理器(DSP),並整合了大量與語音控制需求有關的周邊功能。由於是以DSP為基礎,AcuEdge是一個具有相當高設計彈性的語音前端,不僅可以支援純雲端的語音辨識,也可以直接在本地端執行語音指令辨識,或是實現雲端/本地端辨識的混合架構。這對於將語音辨識功能整合到其他終端產品,例如機上盒(STB)、家庭閘道器(Gateway)或IoT集線器(Hub)來說,是相當關鍵的。許多單純的語音控制命令,例如電視頻道切換、音量調整、燈光開關等,都應該直接在本地端執行,其反應速度才能符合消費者的期待。